首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜
首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜自 2024 年 GPT-4o 出现以来,业内各公司纷纷投入巨大的资源进行 TTS 大模型的研发。近几个月内,中文语音合成大模型如雨后春笋般涌现,如 chattts、seedtts、cosyvoice 等。
搜索
自 2024 年 GPT-4o 出现以来,业内各公司纷纷投入巨大的资源进行 TTS 大模型的研发。近几个月内,中文语音合成大模型如雨后春笋般涌现,如 chattts、seedtts、cosyvoice 等。
作为全公司产品做的最好的工程师,同时也是代码写得最好的产品经理,你深刻地知道:搞个靠谱的 AI 应用需要灵感,而好的灵感则需要一个靠谱的 demo 来验证。
AI 大模型的爆发带动了 GPU 的强劲需求,从云端到边缘渗透的 AI 应用也将带动边缘 AI 服务器及加速处理器的需求。
迄今为止,AIGC 主要应用于像 ChatGPT 这样的聊天机器人。初创公司如 Character.AI 和Replika,通过赋予聊天机器人更接近人类伴侣的性格,已经取得了初步的成果。 然而,设想一下,如果我们将这些人工智能角色置于一个类似于 Instagram 的社交平台,并让它们进行互动,那将会带来什么样的全新体验呢?
除了手机之外,AI 硬件最大的机会是什么? Meta 雷朋眼镜销量破百万之后,AI 眼镜越来越成为共识。
AI生图工具Flux,俨然已经掀起了全网的风暴。这张情侣写真逼真、细腻,打光、纹理、毛发,都是挑不出破绽的程度。视频、声音、口型,AI的进化越来越完美了! 最近Flux的爆火,简直把所有人的三观都撼动了。 不懂就问:现在网上的东西,还有什么是真的?
2024年上海的7月是一个沉闷的雨季,但对国产AI 行业来说,却迎来了堪比摇滚乐集会的WAIC(世界人工智能大会)。
如今,Jeff Dean 已经成为谷歌 AI 掌门人,谷歌也从最开始一个狭小的办公空间搬到了加州总部「Bay View」园区。
今年 3 月份,英伟达 CEO 黄仁勋举办了一个非常特别的活动。他邀请开创性论文《Attention Is All You Need》的作者们齐聚 GTC,畅谈生成式 AI 的未来发展方向。
AI 搜索的风,是从 Perplexity 吹起来的。